運用各種資料分析套件和統計模型,解決大數據時代所會遇到的各種難題
R語言是公認處理大數據的最佳利器,不只免費、語法簡單、直覺,還具備數千個功能強大的延伸套件,更讓R語言深入各種不同的應用領域。本書由國際知名的資料分析專家執筆,作者具備豐富的R語言教學經驗,從中篩選出R的基本功能和最新、最好用的套件,並以各種資料集案例,具體展現資料分析成果。
對於有心跨足資料科學、數據分析、量化交易、人工智慧、機器學習等領域的讀者,只會R語言的語法自然是不夠的。我們將帶您運用各種資料分析套件和統計模型,解決大數據時代所會遇到的各種難題,包括:向量運算、文字探勘、資料視覺化、趨勢預測、資料建模,以及各種分析結果的輸出、引用與動態呈現等,全面掌握R語言的各種技巧。
本書特色:
●向量運算:全向量化的資料結構,包括:vector、factorvector、data.frame、list、matrix、array等
●文字探勘:各類資料匯入讀取、抽取字串、表格轉換與合併、資料聚合、資料正規化、網路爬蟲
●資料視覺化:最吸睛的ggplot2套件圖表繪製技巧,並利用Shiny套件產生網頁互動展示儀表板
●機率統計:快速領略統計學核心應用,抽樣分佈、假設檢定、變異數分析、資料分群
●趨勢預測:展現大數據威力的強力工具,線性迴歸、廣義線性模型、非線性模型、時間序列與自相關性
●資料建模:機器學習的基礎,利用Caret評斷資料模型配適度,建立資料測試與訓練機制,透過交叉驗證和參數挑選建立最佳模式
●進階應用:資料分析師必學的套件包裝與發佈、報表/投影片製作、制式化文件輸出等
語法 資料分析 輸出 大數據 機器學習 資料視覺化 建模 模型 向量 語言 資料